Graph-GRPO: Entrenamiento de Modelos de Flujo de Grafos con Aprendizaje por Refuerzo Descubre cómo Graph-GRPO entrena modelos de flujo de grafos con RL para optimizar moléculas, alcanzando 95% VUN en planares. Innovador y eficiente. 2026-06-09 · 2 min